import os

"""
python版本：3.7
简介：使用python搭配pandoc实现文档格式转换，本程序是演示html转换为word
时间：2021年11月11日

pandoc简介：
-- pandoc是一个强大的文档转换工具，可以实现多种文档格式间的转换
-- pandoc需要下载并安装到系统中才可以使用
-- pandoc官网：https://pandoc.org/
-- pandoc也有python科学包：pypandoc

"""


def transfer_file(file_dir):
    count = 1
    for root, dirs, files in os.walk(file_dir):  # 获取当前文件夹的信息
        for file in files:  # 扫描所有文件
            if os.path.splitext(file)[1] == ".html":  # 提取出所有后缀名为.html的文件
                os.chdir(root) # os.chdir() 方法用于改变当前工作目录到指定的路径。

                print("正在转换第:" + str(count) + "个文件")
                count = count + 1

                print("转换开始：" + "pandoc " + file + " -o " + os.path.splitext(file)[0] + ".docx")
                # 使用os.system调用pandoc进行格式转化
                os.system("pandoc " + file + " -o " + os.path.splitext(file)[0] + ".docx")
                print("转换完成...")


if __name__ == "__main__":
    # os.path.realpath(__file__))是当前python文件所在的文件夹路径，如果想要转换指定文件夹，可以修改此路径
    transfer_file(os.path.dirname(os.path.realpath(__file__)))
